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(57) Abstract 

The invention relates to a method for voice recognition, wherein a bigram method with integrated unequivocal syntax restriction is 
combined with an N-gram voice model with statistical word sequence evaluation in such a way that alternative recognition methods can 
be used in different segments of a word sequence. 


(57) Zusammenfassung 

Fur ein Verfahren zur Spracherkennung wird vorgeschlagen, ein Bigram-Verfahren mit integrierter eindeutiger Syntax-Einschrankung 
zu kombinieren mit einem N-gram-Sprachmodell mit statistischer Wortfolgen-Bewertung in der Weise, dass die alternativen Erkennungsver- 
fahren auf verschiedene Abschnitte einer Wortfolge angewandt werden. 
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VEFAHREN ZUR SPRACHERKENNING UNTER VERWENDUNG VON EINER GRAMMATIK 
5 Beschreibung 

Die Erfindung betrifft ein Verfahren zur Spracherkennung von aus mehreren Wortern 
eines gegebenen Wortschatzes zusammengesetzten Wortfolgen. 

10 Bei der Erkennung verbunden gesprochener Sprache, die eine beiiebige [Combination 
aller Worter zuiaBt, steigt die Fehlerrate im Vergleich zur Einzelwort-erkennung erheb- 
lich an. Um dem entgegenzuwirken, wird Wissen uber zulassige Wortfolgen in soge- 
nannten Sprachmodellen gespeichert und bei der Erkennung zur Reduzierung der An- 
zahl der Wortfolgen eingesetzt 

15 

Sprachmodelle werden meist als sogenannte N-gram-Modelle definiert, wobei N die 
Tiefe des Modelies bezeichnet, d.h. N aufeinanderfolgende Worter innerhaib einer Wort- 
folge werden bei der aktuellen Bewertung berucksichtigt. Wegen des mit zunehmendem 
N schneil ansteigenden Aufwands im ErkennungsprozeB werden primar Bigram (N«2) 
20 oder Trigram (N=3) Sprachmodelle angewandt. 

In der DE 195 01 599 C1 ist neben verschiedenen vorbekannten Verfahren zur Spra- 
cherkennung ein Verfahren beschrieben, das die Speicherung von Satzen mit fester 
Syntax und beliebiger Lange N in einem Bigram-Sprachmodell erlaubt. Das Verfahren 
25 integriert Wissen uber die Syntax zulassiger Satze (Wortfolgen) in das Sprachmodell 

und wird daher auch als syntaktisches Bigram bezeichnet. Ein wesentliches Element zur 
Integration der Syntax in das Sprachmodell ist die Indizierung von in verschiedenen 
Satzkonstellationen mehrfach auftretenden Wortern. Der Spracherkenner ist dadurch 
mit und ohne integrierte Syntax identisch. 
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Der nach dem syntaktischen Bigram-Sprachmodell arbeitende Spracherkenner erreicht 
mit der starken Einschrankung der eriaubten Wortfoigen bei begrenzter Anzahl zuiassi- 
ger Satze eine hohe Erkennungsrate, ist jedoch auch nur einsetzbar, wenn syntaktische 

5 Einschrankungen zuverlassig angegeben werden konnen und eingehalten werden, bei- 
spielsweise bei kurzen Kommandos, Datums- oder Zeitangaben und dgl. Bei einer gro- 
Ben Anzahl zuiassiger Wortfoigen wird eine vollstandige Vorgabe der Syntax aber sehr 
aufwendig und in Situationen, wo auch spontan formulierte Wortfoigen erkannt werden 
sollen, bei welchen die Einhaltung syntaktischer Einschrankungen nicht gewahrleistet 

10 ist, ist die Erkennung nach einem streng syntaktischen Sprachmodell nur bedingt ge- 
eignet. 

Der vorliegenden Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren zur Spra- 
cherkennung anzugeben, welches gegeniiber den bisherigen Verfahren bei guter Erken- 
15 nungsrate einen erweiterten Einsatzbereich bietet. 

Die Erfindung ist im Patentanspruch 1 beschrieben. Die Unteranspruche enthalten vor- 
teilhafte Ausgestaltungen und Weiterbildungen der Erfindung. 

20 Die kombinierte Anwendung von zwei verschiedenen Erkennungsverfahren, insbesonde- 
re mit verschiedenem Umfang syntaktischer Einschrankung, vorzugsweise von Erken- 
nungsverfahren nach einem Sprachmodell mit eindeutiger Syntax einerseits und einem 
statistischen N-gram Sprachmodell andererseits fuhrt uberraschenderweise zu einem 
erheblich vergroBerten Einsatzbereich, wobei sich verschiedene Kombinationsmoglich- 

25 keiten ergeben. Wesentlich an der Kombination ist, daB aufeinanderfolgende Wortfol- 
genabschnitte einer zusammenhangenden Wortfolge nach verschiedenen Erkennungs- 
verfahren behandelt werden. Je nach Einsatzbereich kann dabei eine unterschiedliche 
Unterteilung der gesamten Wortfolge in Abschnitte und die Anwendung der verschiede- 
nen Erkennungsverfahren vorteilhaft sein. Unter Wortern seien dabei hier und im fol- 

30 genden nicht aileine Worter im sprachlichen Sinne als Lautfolgen mit einem zuweisba- 
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ren Begriffsinhalt gemeint, sondern unter Wortern seien vielmehr allgemein einheitlich 
im Spracherkenner verarbeitete Lautfolgen gemeint, beispielsweise auch die Ausspra- 
che einzelner Buchstaben, Siiben oder Siibenfolgen ohne bestimmte Begriffszuordnung. 

5 Bei der Einteilung einer Wortfoige in zwei oder mehr Abschnitte kann insbesondere we- 
nigstens ein Abschnitt in Position und/oder Lange fest vorgegeben sein. Ein solcher 
fest vorgegebener Abschnitt kann insbesondere am Anfang einer Wortfoige positioniert 
sein und dabei auch eine feste Lange in der Anzahl der von ihm umfaBten Worter auf- 
weisen. Vorteilhafterweise wird dann diesem Abschnitt das Erkennungsverfahren mit 

10 der integrierten eindeutigen Syntax zugewiesen. Durch die begrenzte Lange des Ab- 
schnitts bleibt der Aufwand bei der Vorgabe der Syntax und bei der Verarbeitung nach 
dem Erkennungsverfahren mit integrierter eindeutiger Syntax in akzeptabien Grenzen. 
Gleichzeitig kann die Menge der sinnvollen Wortfolgen durch die Syntaxvorgabe und 
deren Berucksichtigung in dem ersten Abschnitt erhebiich eingeschrankt werden. Ein 

15 vorteilhaftes Anwendungsgebiet hierfur ist die Eingabe von Begriffen durch Buchstabie- 
ren. Beispielsweise kann die Erkennung von einigen zehntausend verschiedener Stad- 
tenamen bei buchstabierender Spracheingabe durch die Kombination eines anfangli- 
chen Abschnitts fester Lange und dessen Verarbeitung nach einem Erkennungsverfah- 
ren mit integrierter eindeutiger Syntax und die Weiterverarbeitung der auf diesen Ab- 

20 schnitt folgenden Spracheingabe nach einem statistischen N-gram Erkennungsverfah- 
ren, insbesondere einem Bigram-oder Trigram-Erkennungsverfahren mit uberraschend 
hoher Erkennungsrate und geringem Aufwand durchgefuhrt werden. Bei alleiniger An- 
wendung eines Erkennungsverfahrens mit integrierter eindeutiger Syntax wiirde der 
Aufwand fur die Syntaxintegration und Verarbeitung den vertretbaren Rahmen spren- 

25 gen. Andererseits zeigt eine reine Anwendung eines statistischen Sprachmodells in 
solchen Fallen eine nur unzureichende Erkennungsrate. 

Andere Anwendungsbeispiele fur den vorteilhaften Einsatz eines abschnittsweise einge- 
setzten Erkennungsverfahren mit integrierter eindeutiger Syntax sind Wortfolgen mit 
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Datums- Oder Zeitangaben, deren Wortumfeid dann vorteilhafterweise mit einem stati- 
stischen Sprachmodell verarbeitet wird. 

Besonders vorteilhaft ist die Kombination eines statistischen Sprachmodells mit einern 
5 Sprachmodell mit integrierter Syntax-Einschrankung auch bei der Erkennung von Wort- 
folgen, in welchen mit wiederkehrenden charakteristischen Begriffen oder Phrasen ge- 
rechnet werden kann. Hierbei wird vorzugsweise das statistische Erkennungsverfahren 
als Standard-Vorgehensweise eingesetzt und durch an sich bekanntes Oberwachen des 
Wortflusses auf bestimmte Begriffe oder Phrasen (Word-Spotting oder Phrase-Spotting) 

10 kann bei Detektion solcher Begriffe oder Phrasen ein Abschnitt eingeleitet werden, in 
welchem die Spracherkennung nach dem Erkennungsverfahren mit integrierter eindeu- 
tiger Syntax erfolgt. Dieser Abschnitt kann eine feste oder variable, insbesondere auch 
eine an den jeweiiigen Begriff oder die jeweilige Phrase angepaBte Lange besitzen. 
Nach Ende dieses Abschnitts kann, sofern die Wortfoige sich fortsetzt, wieder zu dem 

15 Standard-Erkennungsverfahren mit statistischer Wortfolgen-Bewertung zuruckgewech- 
selt werden. 

Fur das Erkennungsverfahren mit integrierter eindeutiger Syntax wird vorzugsweise das 
aus dem eingangs genannten Stand derTechnik bekannte syntaktische Bigram- 

20 Erkennungsverfahren eingesetzt. Fur das statistische Spracherkennungsverfahren mit 
Wortfolgen-Bewertung ist zur Anwendung eines einheitlichen Spracherkenners dann 
gleichfalls ein Bigram-Erkennungsverfahren vorteilhaft. Andererseits zeigt ein statist!- 
sches Erkennungsverfahren mit hoherem N eine verbesserte Erkennungsrate, erfordert 
aber auch einen hoheren Verarbeitungsaufwand. Ein vorteilhafter KompromiB ist die 

25 Anwendung eines Trigram-Erkennungsverfahrens fur das statistische Erkennungsverfah- 
ren, wobei eine bevorzugte Ausfuhrungsform der Erfindung vorsieht, die Erkennung mit 
der Informationsfulle eines Trigram-Erkennungsverfahrens in Form einer Bigram- 
Verarbeitung durchzufuhren. 
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Die Erfindung ist nachfolgend anhand von bevorzugten Ausfuhrungsbeispielen unter 
Bezugnahme auf die Abbildungen noch eingehend veranschaulicht. Dabei zeigt: 


Fig. 1 das einfache Ablaufschema der Verarbeitung fur das 

5 Beispiei einer buchstabierenden Spracheingabe 

Fig. 2 einen Netzwerkgraphen nach dem Stand der Technik 

Fig. 3 den Graphen nach Fig. 2 mit zusatzlicher Syntax-Einschrankung 

Fig. 4 den Anfang des Graphen nach Fig. 3 und Anwendung der 
Erfindung 

10 Fig. 5 ein erweitertes Beispiei nach dem Prinzip der Fig. 4 


AIs Beispiei zur Erlauterung der Erfindung anhand der Figuren sei die buchstabierende 
Spracheingabe von Stadtenamen gewahlt. Das Lexikon eines hierfur einzusetztenden 
Buchstabiererkenners umfaBt ca. 30 Buchstaben sowie einige Zusatzworte wie Doppel 
15 oder Bindestrich. Die Liste der Stadtenamen enthalte beispielsweise einige zehntau- 
send Eintrage, so daB eine vollstandige Speicherung der eindeutigen syntaktischen In- 
formation (in diesem Falle der Buchstabenfolgen) den Umfang des die syntaktische 
Information enthaltenden Lexikons sowie den Rechenzeitbedarf bei der Erkennung in 
inakzeptable Hohen treiben wurde. 

20 

Das in Fig. 1 skizzierte Ablaufschema bei der Erkennung einer buchstabierenden Einga- 
be ohne irgendwelche Vorgaben gibt durch die eingezeichneten Pfeile an, daB ausge- 
hend von einem Startknoten, die Wortfolge (in dem gewahlten Beispielsfall eine Folge 
einzeln ausgesprochener Buchstabennarnen) mit einem beiiebigen der vorgesehen 
25 Buchstaben beginnen kann und auf jeden Buchstaben ein beliebiger anderer Buchstabe 
folgen kann, sofern nicht bereits die Wortfolge endet, was durch den Endeknoten repra- 
sentiert ist. 

In der gebrauchlichen Netzwerk-Graphen-Darstellung sind beispielsweise Netzwerkpfa- 
30 de fur die Stadtenamen Aachen, Aalen und Amberg eingetragen. Wie in der eingangs 
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zurn Stand der Technik bereits genannten DE 195 01 599 C1 dargelegt wind, ergeben 
sich bei einem solchen Netzwerk-Graphen durch die an verschiedenen Positionen des 
Netzwerks auftretenden gleichen Wortknoten (Buchstaben) neben den durch die Netz- 
werkpfade vorgesehenen sinnvoilen Wortfolgen auch eine Vielzahl von unsinnigen Wort- 
5 folgen, die aber nach dem Sprachmodeil als zulassig gelten. 

In der DE 195 01 599 C1 wird zur Behebung dieses Problems vorgeschlagen, diejenigen 
Wortknoten, die in dem Netzwerk mehrfach auftreten, durch Indizierung zu unterschei- 
den. Durch die Indizierung werden alle Wortknoten des Netzwerkes eindeutig und.zu 
10 jedem Wortknoten konnen als die Gesamtheit aller zulassigen Wortfolgen beschreiben- 
de Syntax volistandig die zulassigen nachfolgenden Wortknoten angegeben werden. 
Insbesondere bei der buchstabierenden Eingabe von Begriffen aus einer groBen Liste 
von Begriffen ist die Vieldeutigkeit des Netzwerk-Graphen ohne Indizierung enorm hoch. 

15 In Fig. 4 wird unter Zugrundelegen des Beispiels der Fig. 3 das Vorgehen nach der Er- 
findung dargestellt. Gewahlt ist der Anschaulichkeit halber eine Variante der Erfindung, 
bei welcher am Anfang der Wortfolge ein Abschnitt konstanter vorgegebener Lange 
nach einem Erkennungsverfahren mit eindeutiger Syntax-Integration verarbeitet wird 
und danach auf ein statistisches Erkennungsverfahren mit Wortfolgen-Bewertung ge- 

20 wechselt wird. Als Erkennungsverfahren mit eindeutiger syntaktischer Einschrankung 
wird ein syntaktisches Bigram-Erkennungsverfahren zugrundegelegt. Die Lange des 
einleitenden Abschnitts am Beginn der Wortfolge sei zu ^3 Worten angenommen. Fur 
den nachfolgenden, in der Lange a priori nicht bekannten oder beschrankten Abschnitt 
der Wortfolge sei der Einsatz eines statistischen Erkennungsverfahrens mit Wortfoigen- 

25 Bewertung mit der Informationstiefe eines Trigram-Verfahrens angenommen. Weiter sei 
zur Veranschaulichung einer besonders bevorzugten Ausfuhrungsform.der Erfindung die 
Verarbeitung der Trigram-Information nach Art eines Bigram-Erkennungsverfahrens be- 
schrieben, indem die innerhaib des Trigram-Fensters vorhandene Informationsmenge 
von 3 Worten (Worttripel) aufgeteilt wird in zwei (Worttupel) uberlappende Pseudowor- 
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te, die jeweils aus einer Kombination zweier aufeinanderfolgender Worte des zugrunde- 
gelegten Trigram-Fensters bestehen. 

Bei den in Fig. 4 skizzierten Beispiei wird ausgehend von dem Startknoten zu Beginn 
einer Wortfolge in an sich aus dem Stand der Technik bekannter Weise ein syntakti- 
sches Bigram-Erkennungsverfahren angewandt. Fur die in Fig. 2 und Fig. 3 als Netz- 
werkpfade eingetragenen Stadtenamen 


AACHEN 
10 AALEN 
AMBERG 


bedeutet dies, daB die ersten drei einzeln gesprochenen Buchstaben 


15 AAC 
AAL 
AMB 

nach dem syntaktischen Bigram-Erkennungsverfahren verarbeitet werden. Fur die Ver- 
20 arbeitung des nachfolgenden Wortfolgenabschnitts nach einem Trigram- 

Erkennungsverfahren ist es vorteilhaft, wenn die Information aus dem ersten Abschnitt 
bereits als Historie fur den Beginn des zweiten Abschnitts mit ausgewertet werden 
kann. Fur die Verarbeitung mit der Informationstiefe eines Trigrams bedeutet dies, daB 
die Buchstabenfolgen 


ACHEN 

ALEN 

MBERG 
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der Information mit Trigram-lnformationsumfang vorteilhafterweise zur Verfugung ste- 
hen sollten* Die Verarbeitung in dem zweiten Abschnitt der buchstabierend eingegebe- 
nen Wortfolge schlieBt daher vorteilhafterweise die letzten beiden Buchstaben des er- 
sten Abschnitts mit ein. 

5 

Besonders vorteilhaft ist es, wenn in alien aufeinanderfolgenden Abschnitten derselbe 
Spracherkenner eingesetzt werden kann. Hierzu wird nun in dem zweiten Abschnitt die 
mit Trigram-lnformationstiefe vorliegende Information nach Art eines Bigram- 
Erkennungsverfahrens verarbeitet. Hierzu wird das Worttripel des schrittweise gleitend 
10 fiber die Wortfolge verschobenen Trigram-Fensters zu einem Pseudowort-Tupel umge- 
formt, in dem jeweils zwei benachbarte Worte des Worttripels des Trigram-Fensters zu 
einem Pseudowort zusammengefaBt werden. Fur die gewahlten Beispiele ergibt sich 
damit eine Folge von Pseudoworten der Art 

15 AC CH HE EN 
AL LE EN 
MB BE ER RG 


wobei jeweils zwei aufeinanderfolgende Pseudoworte (Buchstabenpaar) die Sprachin- 
20 formation eines Worttripels aus einem Trigram-Fenster enthalten. Durch die Umfor- 
mung der Worttripel zu Pseudowort-Tupeln wird eine Bigram-Verarbeitung, welche je- 
weils lediglich zwei aufeinanderfolgende Pseudoworte berucksichtigt, unter Erhalt der 
Trigram-lnformationstiefe moglich. Durch die Bigram-Verarbeitung auch im zweiten Ab- 
schnitt bleibt der Aufbau des Spracherkenners uber die gesamte Wortfolge gleich. 

25 

Fur den Ubergang von dem ersten Abschnitt mit Verarbeitung nach einem syntakti- 
schen Bigram-Erkennungsverfahrens zu dem zweiten Abschnitt mit Verarbeitung nach 
dem Pseudowort-Bigram-Erkennungsverfahren ohne syntaktische Einschrankung wird 
vorteilhafterweise im ersten Abschnitt eine Erganzung des letzten Wortknotens um die 
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Information des vorangegangenen Wortknotens vorgenommen, so daB sich in dem er- 
sten Abschnitt nun eine Folge von Wortknoten (Buchstaben) der Art 

A A AC 
5 A A AL 
AM MB 

ergibt, wobei der letzte Wortknoten wieder ein Pseudowort mit der information des vor- 
angegangenen Knotens darstellt. 

10 

In Fig. 5 ist ein nach diesem Prinzip aufgebauter Ausschnitt des Netzwerk-Graphen fur 
die auch in Fig. 2 und Fig. 3 gewahlten Beispiele dargestellt Ausgehend von einem 
Startknoten wird das Netzwerk im ersten Abschnitt durch Einzelwort-Knoten 
(Einzelbuchstaben) aufgebaut, welche dann am Ubergang zu dem zweiten Abschnitt in 

15 Pseudowort-Knoten mit jeweils dem Informationsumfang von zwei aufeinanderfolgen- 
den Buchstaben ubergehen. Die Ubergange zwischen den Pseudowort-Knoten werden 
in an sich bekannter Weise anhand von Lernstichproben bewertet. Der so entstehende 
Netzwerk-Graph umfaSt die Kombination der beiden verschiedenen Erkennungsverfah- 
ren. Trotz der wesentlich hoheren Anzahl der unterscheidbaren Pseudoworte gegeniiber 

20 der Anzahl der verschiedenen Buchstaben ergibt der Verzicht auf die durchgehende 
Anwendung einer syntaktischen Einschrankung uber das gesamte Netzwerk eine er- 
hebliche Reduzierung des Verarbeitungsaufwands, bei hoher Erkennungsrate. 

Bei dem Beispiel der Fig. 5 ist durch Pfeile von jedem der Pseudowort-Knoten zu dem 
25 Endeknoten berucksichtigt, daB die Spracheingabe auch bereits nach nur einem Teii 

der vollstandigen Wortfoige bereits fur die Zuweisung eines Begriffs aus der vorgegebe- 
nen Liste ausreichen kann. In einem Erkenner kann dies in der Form implementiert 
sein, daB der Erkenner bei ausreichender Einschrankung der Anzahl der nach Eingabe 
eines Teils der Wortfoige als zutreffend in Frage kommenden Begriffe beispieisweise auf 
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einer Anzeige eine Auswahl von Begriffen anbietet und die Eingabe damit verkurzt wer- 
den kann. 

Die Erfindung ist nicht auf die beschriebenen Ausfuhrungsbeispiele beschrankt, son- 
5 dern im Rahmen fachmannischen Konnens auf verschiedene Weise abwandelbar. Ins- 
besondere ist der Umfang der Berucksichtigung von syntaktischer Information bei dem 
zweiten Verfahren variabel. 
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Patentanspruche 

1 . Verfahren zur Spracherkennung von aus mehreren Wortern eines gegebenen Wort- 
5 schatzes zusammengesetzten Wortfolgen, bei welchem ein erstes Erkennungsver- 

fahren und ein zweites Erkennungsverfahren zur Anwendung auf getrennte Abschnit- 
te einer zu erkennenden Wortfolge vorgesehen sind. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daB das erste Erkennungsver- 
10 fahren ein Erkennungsverfahren mit integrierter eindeutiger Syntax ist. 

3. Verfahren nach einem der Anspruche 1 bis 4, dadurch gekennzeichnet, daB das er- 
ste Verfahren ein Bigram-Erkennungsverfahren mit integrierter eindeutiger Syntax 
ist. 

15 

4. Verfahren nach einem der Anspruche 1 bis 3, dadurch gekennzeichnet, daB das 
zweite Erkennungsverfahren ein Erkennungsverfahren mit statistischer Wortfolgen- 
Bewertung ist. 

20 5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daB das zweite Verfahren ein 
Trigram-Erkennungsverfahren ist, bei welchem die zulassigen Wortfolgen uber eine 
rein statistische Bewertung eingeschrankt werden 

6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daB die Worttripel des Tri- 
25 gram-Fensters als Pseudowort-Tupel dargestellt werden, wobei die beiden Pseudo- 
worter eines Tupels uberiappen und jeweils zwei Worter des entsprechenden Tripeis 
enthalten. 
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7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daB bei einem Wechsel von 
dem ersten Erkennungsverfahren mit integrierter eindeutiger Syntax zu dem zweiten 
Erkennungsverfahren mit statistischer Wortfolgen-Bewertung die letzten beiden Wor- 
ter des nach dem ersten Verfahren bearbeiteten Abschnitts zu einem Pseudowort 
zusammengefaBt werden. 

8. Verfahren nach einem der Anspruche 1 bis 7, dadurch gekennzeichnet, daB zumin- 
dest ein Abschnitt in seiner Position und/oder seiner Lange vorgegeben und fest ei- 
nem der aiternativen Erkennungsverfahren zugewiesen ist. 

9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, daB ein Abschnitt vorgegebe- 
ner Lange am Satzanfang nach dem ersten Erkennungsverfahren mit integrierter 
Syntax verarbeitet wird. 

10. Verfahren nach einem der Anspruche 1 bis 8, dadurch gekennzeichnet, daB als 
Standard das zweite Erkennungsverfahren ohne integrierte Syntax angewandt wird 
und ein Wechsel zu dem ersten Erkennungsverfahren mit integrierter Syntax auf- 
grund einer Wort- oder Phrasendetektion (Word-Spotting oder Phrase-Spotting) vor- 
genommen wird. 
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Artikel 18 ubermittelt. Eine Kopie wird dem Internationalen Buro ubermittelt. 

Dieser internationale Recherchenbericht umfaGt insgesamt _3 Blatter. 

|~X~| Daruber hinaus liegt ihm jeweils eine Kopie der in diesem Bericht genannten Unterlagen zum Stand der Technik bei. 


1 . Grundlage des Berichts 

a. Hinsichtlich der Sprache ist die internationale Recherche auf der Grundlage der internationalen Anmeldung in der Sprache 
durchgefuhrt worden, in der sie eingereicht wurde, sofern unter diesem Punkt nichts anderes angegeben ist. 

| | Die internationale Recherche ist auf der Grundlage einer bei der Behorde eingereichten Ubersetzung der internationalen 
Anmeldung (Regel 23.1 b)) durchgefuhrt worden. 

b. Hinsichtlich der in der internationalen Anmeldung offenbarten Nucleotid- und/oder Aminosauresequenz ist die internationale 
Recherche auf der Grundlage des Sequenzprotokolls durchgefuhrt worden, das 

| | in der internationalen Anmeldung in Schriflicher Form enthalten ist. 

zusammen mit der internationalen Anmeldung in computerlesbarer Form eingereicht worden ist. 
bei der BehdYde nachtraglich in schriftlicher Form eingereicht worden ist. 
bei der Behorde nachtraglich in computerlesbarer Form eingereicht worden ist. 

Die Erklarung, daR das nachtraglich eingereichte schrifttiche Sequenzprotokoll nicht uber den Offenbarungsgehalt der 
internationalen Anmeldung im Anmeldezeitpunkt hinausgeht, wurde vorgelegt. 

| | Die Erklarung, dafi die in computerlesbarer Form erfaBten Informationen dem schriftlichen Sequenzprotokoll entsprechen, 
wurde vorgelegt. 

| | Bestimmte Anspruche haben sich als nicht recherchierbar erwiesen (siehe Feld I). 
| | Mangelnde Einheitlichkeit der Erfindung (siehe Feld II). 


□ 
□ 
□ 
□ 


2. 
3. 


Hinsichtlich der Bezeichnung der Erfindung 

| | wird der vom Anmelder eingereichte Wortlaut genehmigt. 
PC] wurde der Wortlaut von der Behorde wie folgt festgesetzt: 

VEFAHREN ZUR SPRACHERKENNING UNTER VERWENDUNG VON EINER GRAMMATIK 


5. Hinsichtlich der Zusammenfassung 

wird der vom Anmelder eingereichte Wortlaut genehmigt. 

wurde der Wortlaut nach Regel 38.2b) in der in Feld III angegebenen Fassung von der Behorde festgesetzt. Der 
I I Anmelder kann der Behorde innerhalb eines Monats nach dem Datum der Absendung dieses internationalen 
Recherchenberichts eine Stellungnahme vorlegen. 

6. Folgende Abbildung der Zeichnungen ist mit der Zusammenfassung zu veroffentlichen: Abb. Nr. 5 


| | wie vom Anmelder vorgeschlagen Q^] keine der Abb. 

[X] weil der Anmelder selbst keine Abbildung vorgeschlagen hat. 
| | weil diese Abbildung die Erfindung besser kennzeichnet. 
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INTERNATIONALE!* RECHERCHENBERICHT 


m 


ationafes Aktenzeichen 

/DE 98/03536 


A. KLASSIFIZIERUNG DES ANMELDUNGSGEGENSTANDES 

IPK 6 G10L5/06 


Nach der Internationalen Patentklassifikation (IPK) Oder nach der nationalen Klassifikation und der IPK 
B. RECHERCHIERTE GEBIETE 


Recherchierter Mindestprufstoff (Klassifikationssystem und Klassifikationssymbole ) 

IPK 6 G10L 


Recherchierte aber nicht zum Mindestprufstoff gehorende Verbffentlichungen, soweit diese unter die recherchierten Gebiete fallen 


Wahrend der internationalen Recherche konsultierte elektronische Datenbank (Name der Datenbank und evtl. verwendete Suchbegriffe) 


C. ALS WESENTLJCH ANGESEHENE UNTERLAGEN 


Kategorie 0 Bezeichnung der Veroffentlichung, soweit erforderlich unter Angabe der in Betracht kommenden Teile 


Betr. Anspruch Nr. 


METEER M ET AL: "STATISTICAL LANGUAGE 
MODELING COMBINING N-GRAM AND CONTEXT-FREE 
GRAMMERS" 

SPEECH PROCESSING, MINNEAPOLIS , APR. 27 - 
30, 1993, 

Bd. 2, 27. April 1993, Seiten 11-37-40, 
XP000427719 

INSTITUTE OF ELECTRICAL AND- ELECTRONICS 
ENGINEERS 

* Absatz "Combining Linguistic Models and 

N-Grams" * 

idem 


-/-- 


1,2,4 


3,10 


0 


Weitere Veroffentlichungen sind der Fortsetzung von Feld C zu 
entnehmen 


Siehe Anhang Patentfamilie 


° Besondere Kategorien von angegebenen Veroffentlichungen 

"A" Veroffentlichung, die den allgemeinen Stand der Technik definiert, 
aber nicht als besonders bedeutsam anzusehen ist 

"E" alteres Dokument, das jedoch erst am Oder nach dem internationalen 
Anmeldedatum veroffentlicht worden ist 

"L" Veroffentlichung, die geeignet ist, einen Prioritatsanspruch zweifelhaft er- 
scheinen zu lassen, oder durch die das Veroffentlichungsdatum einer 
anderen im Recherchenbericht genannten Veroffentlichung belegt werden 
soli Oder die aus einem anderen besonderen Grund angegeben ist (wie 
ausgefuhrt) 

"O" Veroffentlichung, die sich auf eine mundliche Offenbarung, 

eine Benutzung, eine Ausstellung oder andere MaGnahmen bezieht 
"P° Veroffentlichung, die vor dem internationalen Anmeldedatum, aber nach 
dem bean sp rue hten Priorit&tsdatum veroffentlicht worden ist 


"T" Spatere Veroffentlichung, die nach dem internationalen Anmeldedatum 
oder dem Prioritatsdatum veroffentlicht worden ist und mit der 
Anmeldung nicht kollidiert, sondern nur zum Verstandnis des der 
Erfindung zugrundeliegenden Prinzips oder der ihr zugrundeliegenden 
Theorie angegeben ist 

"X" Veroffentlichung von besonderer Bedeutung; die beanspruchte Erfindung 
kann allein aufgrund dieser Veroffentlichung nicht als neu Oder auf 
erfinderischer Tatigkeit beruhend betrachtet werden 

"Y" Veroffentlichung von besonderer Bedeutung; die beanspruchte Erfindung 
kann nicht als auf erfinderischer Tatigkeit beruhend betrachtet 
werden, wenn die Veroffentlichung mit einer oder mehreren anderen 
Veroffentlichungen dieser Kategorie in Verbindung gebracht wird und 
diese Verbindung fur einen Fachmann naheliegend ist 

"&" Veroffentlichung, die Mitglied derselben Patentfamilie ist 


Datum des Abschlusses der internationalen Recherche 

1. April 1999 

Absendedatum des internationalen Recherche nberichts 

13/04/1999 

Name und Postanschrift der Internationalen Recherchenbehorde 
Europaisches Patentamt, P.B. 5818 Patentlaan 2 
NL - 2280 HV Rijswijk 
Tel. (+31-70) 340-2040, Tx. 31 651 epo nl, 
Fax: (+31-70) 340-3016 

Bevollmachtigter Bediensteter 

Krembel , L 
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INTERN ATIONALEE-RECHERCHENBERICHT 


bationales Aktenzeichen 

^T/DE 98/03536 


C.(Fortsetzung) ALS WESENTLICH ANGESEHENE UNTERLAGEN 

Katscjori© 

G©z©ichnung d©r Vsroffsntlichuncj, sowsit ©rfordsrlich untsr AnQ&fo© dsr in B©tr3Chtkomm©nd©n T©il© 

B©tr. Anspruch Nr. 

Y 

DE 195 01 599 C (DAIMLER BENZ AG) 

3 


2. Mai 1996 



in der Anmeldung erwahnt 



siehe Zusammenfassung 



siehe Spalte 2, Zeile 5 - Zeile 33 




Y 

SEIICHI NAKAGAWA ET AL: "THE 

10 


SYNTAX-ORIENTED SPEECH UNDERSTANDING 



SYSTEM - SPOJUS-SYNO -" 



PROCEEDINGS OF THE EUROPEAN CONFERENCE ON 



cppcru PHMMI IN TP AT THM AMR TFPUMni fl£V 



(EUROSPEECH), PARIS, SEPT. 26 - 28, 1989, 



Bd. 2, Nr. CONF. 1, 1. September 1989, 



Seiten 224-227, XP000209997 



TUBACH J P; MAR I AN I J J 



siehe Abbildung 1 

— 


X 

KENJI KITA ET AL: "INCORPORATING LR 

1,2,4 


PARSING INTO SPHINX" 



SPEECH PROCESSING 1, TORONTO, MAY 14 - 17, 






Bd. 1, Nr. CONF. 16, 14. Mai 1991, Seiten 



269-272, XP000245219 



INSTITUTE OF ELECTRICAL AND ELECTRONICS 



ENGINEERS 



siehe Seite 269, Zeile 26 - Zenle 35 


A 

JURAFSKY D ET AL: "USING A STOCHASTIC 

1 


CONTEXT-FREE GRAMMAR AS A LANGUAGE MODEL 



FOR SPEECH RECOGNITION" 



PROCEEDINGS OF THE INTERNATIONAL 



CONFERENCE ON ACOUSTICS, SPEECH, AND 



SIGNAL PROCESSING (ICASSP), DETROIT, MAY 9 



- 12, 1995 SPEECH, 



Bd. 1, 9. Mai 1995, Seiten 189-192, 



XP000657962 



INSTITUTE OF ELECTRICAL AND ELECTRONICS 



ENGINEERS 



siehe Absatz 2.3 
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INTERNATIONAL SEARCH REPORT 

It^^Hition on patent family members 


Rational Application No 

r/DE 98/03536 


Patent document 
cited in search report 


Publication 
date 


Patent family 
member(s) 


Publication 
date 


DE 19501599 


02-05-1996 


WO 9622593 A 
EP 0804788 A 


25-07-1996 
05-11-1997 


Foim PCT/lSA/210 (patent family annex) (July 1992) 
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VERTRAG UBER 


t 


4 


7 


E INTERNATIONALE ZUSAMMENARBEIT AUF DEM 
GEBIET DES PATENTWESENS 


PCT [rec'd 2 o m 2ooo 

INTERNATIONALER VORLAUFIGER PROfU^KSSBERICHT 

(Artikel 36 und Regel 70 PCT) 


Aktenzeichen des Anmelders oder Anwalts 


./. 


WEITERES VORGEHEN 


siehe Mitteilung uber die Ubersendung des internationalen 
vorlaufigen Prufungsbericht (Formblatt PCT/IPEA/416) 


Internationales Aktenzeichen 
PCT/DE98/03536 


Internationales Anmeldedatum (Tag/Monat/Jahr) 
02/12/1998 


Prioritatsdatum (Tag/Monat/Tag) 
11/12/1997 


Internationale Patentklassification (IPK) Oder nationale Klassifikation und IPK 
G10L5/06 


Anmelder 

DAIMLER CHRYSLER AKTIENGESELLSCHAFT et al. 


1 . Dieser internationale vorlaufige Prufungsbericht wurde von der mit der international vorlaufigen Prufung beauftragte 
Behorde erstellt und wird dem Anmelder gemaB Artikel 36 ubermittelt. 

2. Dieser BERICHT umfaGt insgesamt 5 Blatter einschlieBlich dieses Deckblatts. 

IS AuBerdem liegen dem Bericht ANLAGEN bei; dabei handelt es sich urn Blatter mit Beschreibungen, Anspruchen 
und/oder Zeichnungen, die geandert wurden und diesem Bericht zugrunde liegen, und/oder Blatter mit vor dieser 
Behorde vorgenommenen Berichtigungen (siehe Regel 70.16 und Abschnitt 607 der Verwaltungsrichtlinten zum PCT) 

Diese Anlagen umfassen insgesamt 4 Blatter. 


3. Dieser Bericht enthalt Angaben zu folgenden Punkten: 


Grundlage des Berichts 


II 

□ 

III 

□ 

IV 

□ 

V 


VI 

□ 

VII 


VIII 

□ 


Begrundete Feststellung nach Artikel 35(2) hinsichtlich der Neuheit, der erfinderische Tatigkeit und der 
gewerbiiche Anwendbarkeit; Unterlagen und Erklarungen zur Stutzung dieser Feststellung 
Bestimmte angefuhrte Unterlagen 
Bestimmte Mangel der internationalen Anmeldung 


Datum der Einretchung des Antrags 
03/07/1999 


Datum der Fertigsteflung dieses Berichts 
16.03.2000 


Name und Postanschrift der mit der internationalen vorlaufigen 
Prufung beauftragten Behorde: 

Europaisches Patentamt 

D-80298 Munchen 
Tel. +49 89 2399 - 0 Tx: 523656 epmu d 

Fax: +49 89 2399 - 4465 


Bevollmachtigter Bediensteter 
La Gioia, C 

Tel. Nr. +49 89 2399 2418 


Formblatt PCT/IPEA/409 (Deckbiatt) (Januar 1994) 


f 



■ 
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INTERNATIONALER VORLAUFIGER 
PRUFUNGSBERICHT 


Internationales Aktenzeichen PCT/DE98/03536 


I. Grundlage des Berichts 

1 . Dieser Bericht wurde erstellt auf der Grundlage (Ersatzblatter, die dem Anmeldeamt auf eine Aufforderung nach 
Artikel 14 hin vorgelegt wurden, gelten im Rahmen dieses Berichts a/s "ursprunglich eingereicht" und sind ihm 
nicht beigefugt, weil sie keine Anderungen enthalten.): 

Beschreibung, Seiten: 

1,3-10 ursprungliche Fassung 

2,2a eingegangen am 18/1 1/1999 mit Schreiben vom 16/1 1/1999 

Patentanspruche, Nr.: 

1-6 eingegangen am 18/11/1999 mit Schreiben vom 16/11/1999 

Zeichnungen, Blatter: 

1/2,2/2 ursprungliche Fassung 

2. Aufgrund der Anderungen sind folgende Unterlagen fortgefalien: 

□ Beschreibung, Seiten: 

□ Anspruche, Nr.: 

□ Zeichnungen, Blatt: 

3. □ Dieser Bericht ist ohne Berucksichtigung (von einigen) der Anderungen erstellt worden, da diese aus den 

angegebenen Grunden nach Auffassung der Behorde uber den Offenbarungsgehalt in der ursprunglich 
eingereichten Fassung hinausgehen (Regel 70.2(c)): 

4. Etwaige zusatzliche Bemerkungen: 


Formblatt PCT/IPEA/409 (Felder l-Vili. Blatt 1) (Januar 1994) 
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INTERNATIONALER VORLAUFIGER 
PRUFUNGSBERICHT 


Internationales Aktenzeichen PCT/DE98/03536 


V. Begriindete Feststellung nach Artikel 35(2) hinsichtlich der Neuheit, der erfinderischen Tatigkeit und der 
gewerblichen Anwendbarkert; Unterlagen und Erklarungen zur Stutzung dieser Feststellung 

1 . Feststellung 

Neuheit (N) Ja: Anspruche 1-6 

Nein: Anspruche 

Erfinderische Tatigkeit (ET) Ja: Anspruche 1-6 

Nein: Anspruche 

Gewerbliche Anwendbarkeit (GA) Ja: Anspruche 1 -6 

Nein: Anspruche 

2. Unterlagen und Erklarungen 
siehe Beiblatt 


VII. Bestimmte Mangel der internationalen Anmeldung 

Es wurde festgestellt, daG die internationale Anmeldung nach Form oder Inhalt folgende Mangel aufweist: 
siehe Beiblatt 


Formblatt PCT/IPEA/409 (Felder t-Vlli, Blatt 2) (Januar 1994) 
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INTERNATIONALER VORLAUFIGER Internationales Aktenzeichen PCT/DE98/03536 
PRUFUNGSBERICHT - BEIBLATT 


SECTION V 

A. Es wird auf die folgenden Dokumente verwiesen: 

D1 : Meteer M et al: 'STATISTICAL LANGUAGE MODELING COMBINING N- 
GRAM AND CONTEXT-FREE GRAMMARS', SPEECH PROCESSING, 
MINNEAPOLIS, APR. 27-30, 1993, Bd. 2, Seiten II-37-40, XP000427719, 
IEEE 

D2: Kenji Kita: 'INCORPORATING LR PARSING INTO SPHINX', ICASSP 91, 
SPEECH PROCESSING 1, TORONTO, MAI 14-17 1991, Bd. 1, Seiten 269- 
272, XP000245219, IEEE 

D3: DE 195 01 599 C 

D4: SEIICHI NAKAGAWA et al: THE SYNTAX-ORIENTED SPEECH 

UNDERSTANDING SYSTEM - SPOJUS-SYNO', EUROSPEECH 89, PARIS, 
SEPT. 26-28 1989, Bd. 2, Seiten 224-227, XP000209997 

D3 wurde in der Anmeldung erwahnt. 


B. Die vorliegende Anmeldung erfijllt die in den Artikeln 33(1 )-(3) PCT genannten 
Kriterien, weil der Gegenstand des Anspruchs 1 neu ist und auf einer erfinderi- 
schen Tatigkeit beruht, und zwar aus den folgenden Grunden. 

B.1 Beide Dokumente D1 und D2 offenbaren ein Verfahren zur Spracherkennung, bei 
welchem ein erstes Erkennungsverfahren und ein zweites Erkennungsverfahren 
zur Anwendung auf getrennte Abschnitte einer zu erkennenden Wortfolge 
vorgesehen sind: 

siehe D1, Seite II-37, 'Abstract' und Seite II-39, Absatz 'Combining Linguistic 
Models and N-Grams'; 

siehe D2, Seite 269, rechte Spalte, Zeilen 26 bis 35. 

Es gibt jedoch in diesen Dokumenten keinen Hinweis auf die folgende Merkmale: 
bei einem Wechsel von dem ersten Erkennungsverfahren zu den zweiten 
Erkennungsverfahren die letzten zwei Worter des nach dem ersten Verfahren 
bearbeiteten Abschnitts zu einem Pseudowort zusammengefasst werden, die mit 


Formblatt PCT/Beiblatt/409 (Blatt 1) (EPA- April 1997) 
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INTERNATIONALER VORLAUFIGER Internationales Aktenzeichen PCT/DE98/03536 
PRUFUNGSBERICHT - BEIBLATT 


einem Bigram-Erkennungsverfahren bearbeitet werden. 

Da man in den anderen Dokumenten des derzeit verfugbaren Standes der 

Technik auch keinen Hinweis auf diese Merkmale findet und diese Merkmale nicht 

naheliegend sind, wird der Gegenstand des Anspruchs 1 als erfinderisch 

betrachtet. 


C. Die abhangigen Anspruche enthalten weitere Merkmale und daher ist ihr 
Gegenstand auch neu und erfinderisch. 

SECTION VII 

A. Der Anspruch 1 ist zwar in der zweiteiligen Form abgefaBt; das folgende Merkmal: 
'das erste und das zweite Erkennungsverfahren werden auf getrennte abschnitte 
einer zu erkennenden Wortfolge angewendet' 

ist aber unrichtigerweise im kennzeichnenden Teil aufgefuhrt, da es in den beiden 
Dokumenten D1 und D2 in Verbindung mit den im Oberbegriff genannten 
Merkmalen offenbart wurde (Regel 6.3 b) PCT). 


Formblatt PCT/Beiblatt/409 (Biatt 2) (EPA-April 1997) 
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PCT/DE 98/03536 - WO 99/3' 
(DE-Aktz.: 197 54 957) ; 


Neue Beschreibungsseiten 2 und 2a 

Der nach dem syntaktischen Bigram-Sprachmodell arbeitende Spracherkenner erreicht mit 
der starken Einschrankung der erlaubten Wortfolgen bei begrenzter Anzahf zulassiger Satze 
5 eine hohe Erkennungsrate, ist jedoch auch nur einsetzbar, wenn syntaktische 
Einschrankungen zuveriassig angegeben werden konnen und eingehaiten werden, 
beispielsweise bei kurzen Kommandos, Datums- oder Zeitangaben und dgl. Bei einer groBen 
Anzahl zulassiger Wortfolgen wird eine vollstandige Vorgabe der Syntax aber sehr aufwendig 
und in Situationen, wo auch spontan formulierte Wortfolgen erkannt werden sollen, bei 
10 welchen die Einhaltung syntaktischer Einschrankungen nicht gewahrleistet ist, ist die 
Erkennung nach einem streng syntaktischen Sprachmodell nur bedingt geeignet. 


In einer Veroffentlichung von Meteer et al.:" Statistical Language Modeling Combining N- 
Gram and Context-Free Grammars", Speech Processing, Minneapolis, Apr.27-30, 1993, Bd. 2, 
15 Seiten 11-37-40, XP000427719, IEEE ist eine Kombination linguistischer Erkennungsmodelle 
mit Phrasengrammatiken und N-Gram Erkennungsmodellen in ein Sprachmodell beschrieben. 

Eine Veroffentlichung von Kenji Kita: ..Incorporating LR Parsing into Sphinx", ICASSP 91, 
Speech Processing 1, Toronto, Mai 14-18 1991, Bd.1 Seiten 269-272, XP000245219, IEEE 
20 wird ein Spracherkennungsverfahren beschrieben, das mit einer kontextfreien Grammatik 
beginnt. Kann der Parser mit der kontexfreien Grammatik ein Ergebnis finden , kommt die 
Bigram-Grammatik nicht zum Einsatz. Liegt kein syntaktisch korrektes Ergebnis vor, wird zur 
Bigram-Grammatik umgeschaltet. 

25 Der voriiegenden Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren zur 

Spracherkennung anzugeben, welches gegenuber den bisherigen Verfahren bei guter 
Erkennungsrate einen erweiterten Einsatzbereich bietet. 

Die Erfindung ist im Patentanspruch 1 beschrieben. Die Unteranspruche enthalten 
30 vorteilhafte Ausgestaltungen und Weiterbildungen der Erfindung. 


Ulm, 16.11.99 
110018 


**** 
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PCT/DE 98/03536 - WO 99/ 
(DE-Aktz.: 197 54 957) 


• « - 2a - 


Ulm, 


16.11.99 
110018 


Die kombinierte Anwendung von zwei verschiedenen Erkennungsverfahren, insbesondere mit 
verschiedenem Umfang syntaktischer Einschrankung, vorzugsweise von Erkennungsverfahren 
nach einem Sprachmodell mit eindeutiger Syntax einerseits und einem statistischen N-gram 
Sprachmodeil andererseits fuhrt uberraschenderweise zu einem erheblich vergroBerten 
Einsatzbereich, wobei sich verschiedene Kombinationsmoglichkeiten ergeben. Wesentlich an 
der Kombination ist, daB aufeinanderfolgende Wortfolgenabschnitte einer 
zusammenhangenden Wortfolge nach verschiedenen Erkennungsverfahren behandelt werden. 
Je nach Einsatzbereich kann dabei eine unterschiedliche Unterteilung der gesamten Wortfolge 
in Abschnitte und die Anwendung der verschiedenen Erkennungsverfahren vorteiihaft sein. 
Unter Wortern seien dabei hier und im folgenden nicht alleine Worter im sprachlichen Sinne 
als Lautfolgen mit einem zuweisbaren Begriffsinhait gemeint, sondern unter Wortern seien 
vielmehr allgemein einheitlich 
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PCT/DE 98/03536 - WO 99, 
(DE-Aktz.: 197 54 957) 



Ulm, 16.11.99 
110018 


Neue Patentanspruche 1 - 6 

1. Verfahren zur Spracherkennung von aus mehreren Wortem eines gegebenen 
Wortschatzes zusammengesetzten Wortfolgen, bei welchem ein erstes 
Erkennungsverfahren und ein zweites Erkennungsverfahren vorgesehen sind, dadurch 
gekennzeichnet 

- daB ein erstes Erkennungsverfahren und ein zweites Erkennungsverfahren auf getrennte 
Abschnitte einer zu erkennenden Wortfolge angewendet werden, 

- daB als erstes Verfahren ein Bigram-Erkennungsverfahren mit integrierter eindeutiger 
Syntax angewendet wird, 

- daB als zweite Erkennungsverfahren ein Erkennungsverfahren mit statistischer 
Wortfolgen-Bewertung angewendet wird, und 

- daB bei einem Wechsel von dem Bigram-Erkennungsverfahren mit integrierter eindeutiger 
Syntax zu dem zweiten Erkennungsverfahren mit statistischer Wortfolgen-Bewertung die 
letzten beiden Worter des nach dem ersten Verfahren bearbeiteten Abschnitts zu einem 
Pseudowort zusammengefaBt werden, die mit einem Bigram-Erkennungsverfahren 
bearbeitet werden. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daB zumindest ein Abschnitt in 
seiner Position und/oder seiner Lange vorgegeben und fest einem der alternativen 
Erkennungsverfahren zugewiesen wird. 

3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daB ein Abschnitt vorgegebener 
Lange am Satzanfang nach dem ersten Erkennungsverfahren mit integrierter Syntax 
verarbeitet wird. 

4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daB das zweite Verfahren ein 
Trigram-Erkennungsverfahren ist, bei welchem die zuiassigen Wortfolgen uber eine rein 
statistische Bewertung eingeschrankt werden. 
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110018 


5. 


Verfahren nach Anspruch 4, dadurch gekennzeichnet, da(3 ein Worttripel eines Trigram- 


Fensters als Pseudowort-Tupel dargesteilt wird, wobei die beiden Pseudoworter eines 
Tupels uberlappen und jeweils zwei Worter des entsprechenden Tripels enthalten. 

6. Verfahren nach einem der Anspriiche 1 bis 5, dadurch gekennzeichnet, daB als Standard 
das zweite Erkennungsverfahren ohne integrierte Syntax angewandt wird und ein Wechsel 
zu dem ersten Erkennungsverfahren mit integrierter Syntax aufgrund einer Wort- oder 
Phrasendetektion (Word-Spotting oder Phrase-Spotting) vorgenommen wird. 
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PATENT COOPERATION TREA1 

PCT 

INTERNATIONAL PRELIMINARY EXAMINATION REPORT 

(PCT Article 36 and Rule 70) 


Applicant's or agent's file reference 
197 54 957/110018 

Fnn fiirthfr AfTiriN See Notification °f Transmittal of International 
r tjK. miki ntK al lUiN Preliminary Examination Report (Form PCT/IPEA/416) 

International application No. 

PCT/DE98/03536 

International filing date (day/month/year) 
02 December 1998 (02.12.98) 

Priority date (day/month/year) 

11 December 1997 (1 1 .12.97) 

International Patent Classification (IPC) or national classification and IPC 
G10L5/06 

Applicant 

DAIMLERCHRYSLER AG 



This international preliminary examination report has been prepared by this International Preliminary Examining 
Authority and is transmitted to the applicant according to Article 36. 


This REPORT consists of a total of 


sheets, including this cover sheet. 


This report is also accompanied by ANNEXES, i.e.. sheets of the description, claims and/or drawings which have 
been amended and are the basis for this report and/or sheets containing rectifications made before this Authority 
(see Rule 70.16 and Section 607 of the Administrative Instructions under the PCT). 


These annexes consist of a total of 


4 


sheets. 


This report contains indications relating to the following items: 
Basis of the report 
Priority 

Non-establishment of opinion with regard to novelty, inventive step and industrial applicability 
Lack of unity of invention 

Reasoned statement under Article 35(2) with regard to novelty, inventive step or industrial applicability; 
citations and explanations supporting such statement 

Certain documents cited 

Certain defects in the international application 
Certain observations on the international application 


II 

□ 

III 

□ 

IV 

□ 

V 

El 

VI 

□ 

VII 


VIII 

□ 


Date of submission of the demand 

03 July 1999 (03.07.99) 

Date of completion of this report 

16 March 2000 (16.03.2000) 

Name and mailing address of the IPEA/EP 
Facsimile No. 

Authorized officer 
Telephone No. 


Form PCT/lPEA/409 (cover sheet) (January 1994) 
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INTERNATIONAL PRELIMINARY EXAMINATION REPORT 


International application No. 

PCT/DE98/03536 


I. Basis of the report 


1 . This report has been drawn on the basis of (Replacement sheets which have been furnished to the receiving Office in response to an invitation 
under Article 14 are referred to in this report as "originally filed '' and are not annexed to the report since they do not contain amendments ): 


| | the international application as originally filed. 

the description, pages 1.3-10 

pages 

pages 

pages 


2,2a 


. as originally filed. 
. filed with the demand, 
, filed with the letter of 
, filed with the letter of 


1 8 November I 999 ( 1 8. 11 . 1 999) 


the claims. 


Nos. 
Nos. 
Nos. 
Nos. 
Nos. 


1-6 


. as originally filed, 

. as amended under Article 19, 

. filed with the demand. 
, filed with the letter of 
, filed with the letter of 


1 8 November 1 999 ( 1 8. 1 1 . 1 999) 


the drawings, sheets/fig 
sheets/fig 
sheets/fig 
sheets/fig 


1/2.2/2 


. as originally filed, 
. filed with the demand, 
. filed with the letter of 
, filed with the letter of 


2. The amendments have resulted in the cancellation of: 

□ 

the description, pages 

1 I the claims. Nos. 


I 1 the drawings. sheets/fig 


3 I I This report has been established as if (some of) the amendments had not been made, since they have been considered 
to go beyond the disclosure as filed, as indicated in the Supplemental Box (Rule 70.2(c)). 

4. Additional observations, if necessary: 
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V. Reasoned statement under Article 35(2) with regard to novelty, inventive step or industrial applicability; 
citations and explanations supporting such statement 


Statement 
Novelty (N) 

Inventive step (IS) 
Industrial applicability (IA) 


Claims 
Claims 

Claims 
Claims 

Claims 
Claims 


1-6 


1-6 


1-6 


YES 
NO 
YES 
NO 

YES 
NO 


Citations and explanations 

A. Reference is made to the following documents; 


Dl: Meteer M. et al.: x STATISTICAL LANGUAGE MODELING 
COMBINING N-GRAM AND CONTEXT-FREE GRAMMARS', SPEECH 
PROCESSING, MINNEAPOLIS, APR. 27-30, 1993, Vol. 2, 
pages 11-37-40, XP000427719, IEEE, 
D2: Kenji Kita: * INCORPORATING LR PARSING INTO 
SPHINX' ICASSP 91, SPEECH PROCESSING 1, TORONTO, MAY 
14-17 1991, Vol. 1, pages 269-272, XP000245219, 
IEEE, 

D3: DE 195 01 599 C, 

D4 : SEIICHI NAKAGAWA et al.: 'THE SYNTAX -ORIENTED 
SPEECH UNDERSTANDING SYSTEM - SPOJUS-SYNO' , 
EUROSPEECH 89, PARIS, SEPT. 26-28 1989, Vol. 2, 
pages 224-227, XP000209997. 


D3 has been cited in the application. 


B: The present application satisfies the criteria 

stipulated in PCT Article 33(1) to (3) since the 
subject matter of Claim 1 is novel and involves an 
inventive step for the following reasons. 

B.I.: Both documents Dl and D2 disclose a process for 
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PCT^E 98/03536 


voice recognition wherein first and second 
recognition processes are applied to separate 
segments of a word sequence to be recognised: 
see Dl, page 11-37, 'abstract' and page 11-39, 
paragraph 'Combining Linguistic Models and N-Grams' ; 
see D2, page 269, right-hand column, lines 26 to 35. 

However, none of those documents suggests the 
following features: upon' changing from the first to 
the second recognition process the last two words of 
the segment processed according to the first process 
are combined to form a pseudoword and are processed 
according to a bigram recognition process. 
Since the other currently available prior art 
documents also do not suggest these features and 
since these features are non-obvious, the subject 
matter of Claim 1 is considered to be inventive. 

C: The dependent claims contain additional features and 
therefore their subject matter is also novel and 
inventive . 


Form PCT/IPEA/409 (Box V) (January 1994) 



This Page Blank (uspto) 


INTERNATIONAL PRELIMI 


Y EXAMINATION REPORT 


Tntema^Jp^application No. 

PCT/DE 98/03536 


VII. Certain defects in the international application 


The following defects in the form or contents of the international application have been noted: 


A: Claim 1 has been drafted in the two-part form; 
however, the following feature "the first and 
second recognition processes are applied to 
separate segments of a word sequence to be 
recognised" has been incorrectly specified in the 
characterising part since it has been disclosed in 
documents Dl and D2 in combination with the 
features cited in the preamble ( PCT Rule 6.3(b)). 
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> OF A CHANGE 

(PCT Rule 92bis.1 and 
Administrative Instructions, Section 422) 

To: 

DAIMLERCHRYSLER AG 

Intellectual Property Management 

Gebaude 17 

Sedanstrasse 10 

D-89077 Ulm 

ALLEMAGNE 

Date of mailing (day/month/year) 
13 August 1999(13.08.99) 

Applicant's or agenfs file reference 
197 54 957/110018 

IMPORTANT NOTIFICATION 

International application No. 
PCT/DE98/03536 

International filing date (day/month/year) 
02 December 1998 (02.12.98) 

1. The following indications appeared on record concerning: 

X the applicant Q the inventor Q the agent []] the common representative 

Name and Address 

DAIMLER-BENZ AKTIENGESELLSCHAFT 
Epplestrasse 225 
D-70567 Stuttgart 
Germany 

State of Nationality 1 State of Residence 
DE 1 DE 

Telephone No. 
731 505 2612 

Facsimile No. 

Teleprinter No. 
731 505 2600 

2. The International Bureau hereby notifies the applicant that the following change has been recorded concerning: 
[ | the person X the name Q the address Q the nationality Q the residence 

Name and Address 

DAIMLERCHRYSLER AG 
Epplestrasse 225 
D-70567 Stuttgart 
Germany 

State of Nationality 1 State ot Kesiaence 
DE 1 DE 

Telephone No. 
731 505 2612 

Facsimile No. 

Teleprinter No. 
731 505 2600 

3l Further observations, if necessary: 

4. A copy of this notification has been sent to: 
[X] the receiving Office Q the designated Offices concerned 
| | the International Searching Authority \*\ the elected Offices concerned 
|~X] the International Preliminary Examining Authority | l other: 

The International Bureau of WIPO 
34, chemin des Colombettes 
1211 Geneva 20, Switzerland 

Facsimile No.: (41-22) 740.14.35 

Authorized officer 

Kari Huynh-Khuong 

Telephone No.: (41-22) 338.83.38 
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(PCT Rule 61 .2) 

To: 

Assistant Commissioner for Patents 
United States Patent and Trademark 
Office 
Box PCT 

Washington, D.C.20231 
ETATS-UNIS D'AMERIQUE 

in its capacity as elected Office 

Date of mailing (day/month/year) 
13 August 1999(13.08.99) 

International application No. 
PCT/DE98/03536 

Applicant's or agent's file reference 
197 54 957/110018 

International filing date (day/month/year) 
02 December 1998 (02.12.98) 

Priority date (day/month/yea r) 

11 December 1997 (11.12.97) 

Applicant 

CLASS, Fritz et at , 


1. The designated Office is hereby notified of its election made: 

[)T| in the demand filed with the International Preliminary Examining Authority on: 

03 July 1999 (03.07.99) 


| | in a notice effecting later election filed with the International Bureau on: 


2. The election | X| was 

| { was not 

made before the expiration of 19 months from the priority date or, where Rule 32 applies, within the time limit under 
Rule 32.2(b). 


The International Bureau of WIPO 
34, chemin des Colombettes 
1211 Geneva 20, Switzerland 


Facsimile No.: (41-22) 740.14.35 


Authorized officer 

Kari Huynh-Khuong 

Telephone No.: (41-22) 338.83.38 
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